『星尘』杂谈衡量大数据应用
文章可授权转载,欢迎投稿,稿件根据质量会支付一定金额报酬。联系人:金融监管研究院副院长刘诚燃,联系加微信:18956351980
精选课程
北京
不良资产实战训练营
|12..16-17
『星尘』杂谈衡量大数据应用
与朋友闲聊,说是看各种大数据竞赛啊、活动啊,展示时感觉花样繁多、十分热闹,但自己感觉大数据分析系统并没那么厉害,怎么办?我谈了自己的看法,觉得可能对大家是个参考,于是就有了以下文字。
其一,认为哪一个系统会神乎其神,什么都能做,而且三五步就能简便快捷地使用,还很容易学会,如同傻瓜相机一般……这种高大全、近乎完美的东西,过去与现在,我都没机会见识过,估计未来也不会有。有句老话叫“样样通,样样松”,早年的燕舞牌收录机貌似变形金刚,收音、录音、放音、立体声音响……什么都有,结果“一片歌来一片情”的广告语还在记忆中,牌子与厂子却已烟消云散了。。。任何东西,都会有自己的不完美之处,能解决你目前的现实问题,短期事倍功半,中长期事半功倍,就是好东西。
其二,没有技术门槛,易学易用。其实,任何高大上的东西,最多只是降低了入门的技术门槛,却不会降低技术的整体海拔,除非本来就不高。各种大数据分析系统,只是尽可能提高了分析思维实现的自由度,但也是有很多应用的重难点的,希望用得更出彩,就一定得刻苦努力,日积月累,下实功夫。这个领域是全新的世界,前人走过的路不多,现成饭既不好吃,也没有那么多!
其三,如何衡量应用水平。个人觉得应该区分一下,哪些是以系统为核心做的应用,哪些是贴牌,哪些是虚拟现实主义?我觉得,一看应用思路,二看技术手段,三看推广难度。关键一句话:能否异地重现,能否日常应用。没有高质量、细粒度的持续性数据,没有优秀算法与精准思路,没有对软硬件系统与人力知本的持续投入,就没有战斗力!
其四,什么是当前应用的重难点?除却个人层面的技能与素质差异,个人以为最重要与最难的就是数据治理,尤其是数据标准化。有位徐老师,点出了其中要害:数据需求差异与内涵漂移。他认为此两点不是质量问题,靠治理也好、清理也好都没得解决。以下为他的陈述,我学习之后非常赞同。
“需求差异就是同一个数据项,在产生的各个环节是用于满足不同的需求的,需求是有差异的,大家在生产和加工环节,都优先满足自己的需求,轻视和忽视其他主体的需求。别人要的时候,找个大概差不多的提供出去完事。在粗颗粒度和趋势性的应用里,问题不大,越精细的应用,问题就越大。主体之间,对这种差异认知有限,也没有集中的管控。银行自己用都恼火,到我们这儿就更乱了。这些数据对我们是错的,对生产者来说,有可能是必须的。内涵漂移,管理变化、流程调整、核算方式变化甚至字段变动,都会使现有数据项的内涵发生变动。如果不看数据,这些变化很多是部门内部的,也就是说,数据的含义有轻微的变动,其他部门基本上不可能发现。而这些变化非常频繁,累积的误差越来越多,数据项的内涵也就不断漂移了。等到漂远了再去找原因,很难分析清楚哪儿出错了,更说不上用合理的安排来解决了,多半来次数据清洗完事。”
在竞赛与活动中,大家多展示的是“凭大数据技术我能做什么?”;很少展示“我是怎么做到的?”;没有展示“如何用大数据技术防范信息安全风险?”可以说,只想如何让业务这条腿更强更快,而未曾深入思考如何让技术这条腿更健康,一腿长一腿短的,有没有短期行为呢?劳动竞赛与知识竞赛是不同的,要知行合一,应该有长期的正外部性。
南怀谨先生曾对准备推翻传统文化的台湾学子说过,要革命也得知道自己革的是什么。我们搞金融大数据的,技术创新当然要着力,业务思维也必须重视,作为一个团队,一定要汇聚各方人才,静心研究复杂金融业务,琢磨技术解决途径,上下分层各居其位做其事,基础研究与技能提升并行。慢是慢点儿,但金融与科技两腿健康协调了,方能健步如飞,您说呢?
日期 | 课程 | 地点 |
---|---|---|
12.2-3 | 债券市场基础及实务操作与研究框架 | 上海 |
12.2-3 | 私募基金管理人登记入会、产品创设以及业务合规实务专题培训 | 上海 |
12.7-8 | 大资管新规要点探讨及影响分析研修班 | 上海 |
12.9-10 | 房地产投融资、并购基金以及资产证券化实务操作和案例专题培训 | 上海 |
12.14-15 | 消费金融ABS及资管新政解读 | 上海 |
12.16-17 | 不良资产实战训练营 | 北京 |
12.16-17 | 大资管新规要点探讨及影响分析研修班 | 北京 |
12.16-17 | 反洗钱国际制裁研讨会 | 上海 |
12.16-17 | 票据业务高级研修班 | 厦门 |